MTD：用于场景理解的一百万视频数据集 - 知乎() - 泡面头条

MTD：用于场景理解的一百万视频数据集 - 知乎

2024-10-26

我们提供了Moments in Time Dataset，这是一个大型的人工注释的100万个短视频集，对应于在三秒钟内展开的动态事件。即使是在3秒视频中发生的动作，对 …

本文介绍了MIT-IBM Watson AI Lab发布的Moments-in-Time数据集，这是一个专注于动作分类的视频理解数据集，拥有百万规模的视频和多样性的 …

A large-scale human-annotated collection of short videos for action recognition and event understanding. The dataset covers 339 …

A large-scale human-annotated collection of short videos for action recognition and event understanding. The dataset covers 339 …

更多内容请点击：MTD：用于场景理解的一百万视频数据集 - 知乎推荐文章